1 Introducción

Planteamiento del problema, explicación de como se planea abordar el problema (datos y metodología), enfoque actual / técnica analitica, propuesta de como se abordara este problema y como el análisis ayudará al consumidor de este.

2 Metodología

El dataset utilizado para la realización de este estudio contiene información acerca de estudiantes en sitación de desplazamiento matriculados en instituciones educativas de los 82 municipios no certificados del departamento de Santander. Los datos fueron recopilados y actualizados por la Secretaría de Educación de Santander.

Origen y última actualización

2.1 Paquetes

Para la realización de este proyecto, se utilizaron los siguientes paquetes:

  • library(skimr): este paquete se empleó para obtener un resumen detallado del conjunto de datos. Gracias a él, pudimos explorar las principales características del dataset de manera eficiente.

  • ggplot2: este paquete fue utilizado para crear gráficos de alta calidad. Nos permitió generar diversos diagramas que muestran distribuciones y relaciones entre los datos

  • dplyr: este paquete fue usado para la manipulación de datos. Con él, pudimos filtrar, seleccionar, transformar y resumir la información, facilitando la preparación de los datos necesarios para las visualizaciones.

  • RColorBrewer: este paquete ofrece paletas de colores predefinidas, con el pudimos mejorar la estética de nuestros gráficos y hacerlos visualmente mas atractivos.

2.2 Preparación de los datos

  1. Fuente junto con una explicación general de los datos (propósitos, cuando se recopilaron, cuantas variables habían, peculiaridades, etc)
  2. Pasos de importación y limpieza de datos
  3. Mostrar como se ven los datos finales

2.3 Análisis exploratorio de los datos

3 Resultados

3.1 Análisis demográfico

Enfocado en analizar las características de la población estudiantil desplazada.

¿Cómo se distribuye la población por género?

¿Cuál es la distribución de la población por edades?

¿Cómo se distribuye la población según la etnia?

¿Qué proporción de la población tiene alguna discapacidad?

¿Cuáles son los tipos de desplazamiento más comunes?

3.2 Análisis geográfico

Enfocado en analizar cómo se distribuye la población.

¿Cómo está distribuida la población entre los diferentes municipios y provincias?

3.3 Análisis de las instituciones

Enfocado en analizar las instituciones educativas y su relación con la población desplazada.

¿A qué sector pertenecen las instituciones en donde estudian las personas desplazadas?

¿Qué método educativo es más común entre los estudiantes desplazados?

¿Cuáles son los institutos con mayor número de estudiantes desplazados?

¿Qué instituciones han absorbido más sedes?

3.4 Análisis relacional

Enfocado en explorar correlaciones o patrones entre las variables del dataset.

¿Existe relación entre el método educativo y características demográficas como género, étnica y edad?

¿Cómo se relacionan los motivos de desplazamiento con el grupo étnico de los personas?

  • Información resumida sobre las variables de interés (luego de la limpieza)
  • Mostrar información no evidente
  • Resultados en forma de gráfico y tablas (Facilidad para ver y comprender los resutados)

4 Discusión

Interpretación de los resultados, discutir si los resultados responden a la pregunta hecha inicialmente.

5 Conclusiones

Resumen del problema, resumen de como se abordo el problema (metodologia), ideas interesantes en el analisis, implicaciones para el consumidor, limitaciones de analisis y como se podria mejorar.

6 Referencias